智能论文笔记

Active Relation Discovery: Towards General and Label-aware Open Relation Extraction

Yangning Li , Yinghui Li , Xi Chen , Hai-Tao Zheng , Ying Shen , Hong-Gee Kim

分类：自然语言处理 | 人工智能

2022-11-08

Open Relation Extraction (OpenRE) aims to discover novel relations from open domains. Previous OpenRE methods mainly suffer from two problems: (1) Insufficient capacity to discriminate between known and novel relations. When extending conventional test settings to a more general setting where test data might also come from seen classes, existing approaches have a significant performance decline. (2) Secondary labeling must be performed before practical application. Existing methods cannot label human-readable and meaningful types for novel relations, which is urgently required by the downstream tasks. To address these issues, we propose the Active Relation Discovery (ARD) framework, which utilizes relational outlier detection for discriminating known and novel relations and involves active learning for labeling novel relations. Extensive experiments on three real-world datasets show that ARD significantly outperforms previous state-of-the-art methods on both conventional and our proposed general OpenRE settings. The source code and datasets will be available for reproducibility.

translated by 谷歌翻译

Automatic Context Pattern Generation for Entity Set Expansion

Yinghui Li , Shulin Huang , Xinwei Zhang , Qingyu Zhou , Yangning Li , Ruiyang Liu , Yunbo Cao , Hai-Tao Zheng , Ying Shen

分类：自然语言处理

2022-07-17

实体集扩展（ESE）是一项有价值的任务，旨在找到给定种子实体描述的目标语义类别的实体。由于其发现知识的能力，各种NLP和下游应用程序都受益于ESE。尽管现有的引导方法取得了巨大进展，但其中大多数仍然依赖手动预定义的上下文模式。预定义的上下文模式的不可忽略的缺点是，它们不能灵活地推广到各种语义类别，我们将这种现象称为“语义敏感性”。为了解决这个问题，我们设计了一个上下文模式生成模块，该模块利用自回归语言模型（例如GPT-2）自动为实体生成高质量的上下文模式。此外，我们提出了GAPA，这是一种新型ESE框架，利用上述生成的模式扩展目标实体。对三个广泛使用的数据集进行了广泛的实验和详细分析，证明了我们方法的有效性。我们实验的所有代码都将用于可重复性。

translated by 谷歌翻译

Contextual Similarity is More Valuable than Character Similarity: Curriculum Learning for Chinese Spell Checking

Ding Zhang , Yinghui Li , Qingyu Zhou , Shirong Ma , Yangning Li , Yunbo Cao , Hai-Tao Zheng

分类：自然语言处理

2022-07-17

中文拼写检查（CSC）任务旨在检测和纠正中文拼写错误。近年来，相关研究的重点是引入“混乱设置”以增强CSC模型的角色相似性，忽略了包含更丰富信息的字符的上下文。为了更好地利用上下文相似性，我们为CSC任务提供了一个简单而有效的课程学习框架。借助我们设计的模型不足框架，现有的CSC型号将从人类学习汉字并取得进一步改进的培训。对广泛使用的Sighan数据集进行了广泛的实验和详细分析表明，我们的方法的表现优于先前的最新方法。

translated by 谷歌翻译

A Survey of Natural Language Generation

Chenhe Dong , Yinghui Li , Haifan Gong , Miaoxin Chen , Junxin Li , Ying Shen , Min Yang

分类：自然语言处理 | 人工智能 | 机器学习

2021-12-22

本文对过去二十年来对自然语言生成（NLG）的研究提供了全面的审查，特别是与数据到文本生成和文本到文本生成深度学习方法有关，以及NLG的新应用技术。该调查旨在（a）给出关于NLG核心任务的最新综合，以及该领域采用的建筑;（b）详细介绍各种NLG任务和数据集，并提请注意NLG评估中的挑战，专注于不同的评估方法及其关系;（c）强调一些未来的强调和相对近期的研究问题，因为NLG和其他人工智能领域的协同作用而增加，例如计算机视觉，文本和计算创造力。

translated by 谷歌翻译

Are we ready for a new paradigm shift? A Survey on Visual Deep MLP

Ruiyang Liu , Yinghui Li , Dun Liang , Linmi Tao , Shimin Hu , Hai-Tao Zheng

分类：计算机视觉

2021-11-07

多层erceptron（MLP），作为出现的第一个神经网络结构，是一个大的击中。但是由硬件计算能力和数据集的大小限制，它一旦沉没了数十年。在此期间，我们目睹了从手动特征提取到带有局部接收领域的CNN的范式转变，以及基于自我关注机制的全球接收领域的变换。今年（2021年），随着MLP混合器的推出，MLP已重新进入敏捷，并吸引了计算机视觉界的广泛研究。与传统的MLP进行比较，它变得更深，但改变了完全扁平化以补丁平整的输入。鉴于其高性能和较少的需求对视觉特定的感应偏见，但社区无法帮助奇迹，将MLP，最简单的结构与全球接受领域，但没有关注，成为一个新的电脑视觉范式吗？为了回答这个问题，本调查旨在全面概述视觉深层MLP模型的最新发展。具体而言，我们从微妙的子模块设计到全局网络结构，我们审查了这些视觉深度MLP。我们比较了不同网络设计的接收领域，计算复杂性和其他特性，以便清楚地了解MLP的开发路径。调查表明，MLPS的分辨率灵敏度和计算密度仍未得到解决，纯MLP逐渐发展朝向CNN样。我们建议，目前的数据量和计算能力尚未准备好接受纯的MLP，并且人工视觉指导仍然很重要。最后，我们提供了开放的研究方向和可能的未来作品的分析。我们希望这项努力能够点燃社区的进一步兴趣，并鼓励目前为神经网络进行更好的视觉量身定制设计。

translated by 谷歌翻译

Learning Purified Feature Representations from Task-irrelevant Labels

Yinghui Li , Chen Wang , Yangning Li , Hai-Tao Zheng , Ying Shen

分类：机器学习 | 计算机视觉

2021-02-22

使用有限的数据学习具有泛化的经验有效模型是深度神经网络的一项艰巨任务。在本文中，我们提出了一个名为“纯化学习”的新颖学习框架，以利用在小规模数据集上训练模型时从任务 - iRrelevant标签中提取的任务 - 求物功能。特别是，我们通过使用任务 - 核定信息的表达来纯化特征表示，从而促进分类过程。我们的工作建立在扎实的理论分析和广泛的实验之上，这些实验证明了纯化学习的有效性。根据我们证明的理论，纯化的学习是模型不合时宜的，并且对所需模型没有任何限制，因此可以轻松地将其与任何现有的深神经网络结合在一起，以实现更好的性能。本文的源代码将来将用于可重复性。

translated by 谷歌翻译

Non-Parallel Voice Conversion for ASR Augmentation

Gary Wang , Andrew Rosenberg , Bhuvana Ramabhadran , Fadi Biadsy , Yinghui Huang , Jesse Emond , Pedro Moreno Mengibar

分类：机器学习

2022-09-15

自动语音识别（ASR）需要对说话者的差异很强。语音转换（VC）修改了输入语音的扬声器特征。这是ASR数据增强的吸引人功能。在本文中，我们证明了语音转换可以用作数据增强技术，即使在包含2,456位扬声器的LibrisPeech上，也可以用作提高ASR性能。对于ASR增强，有必要对广泛的输入语音稳健。这激发了使用非自动回旋，非并行VC模型的使用，并在VC模型中使用了预验证的ASR编码器。这项工作表明，尽管包括许多演讲者，但演讲者的多样性可能仍然是ASR质量的限制。最后，对我们的风险投资性能的审讯为客观评估VC质量提供了有用的指标。

translated by 谷歌翻译

Analysis of Self-Attention Head Diversity for Conformer-based Automatic Speech Recognition

Kartik Audhkhasi , Yinghui Huang , Bhuvana Ramabhadran , Pedro J. Moreno

分类：自然语言处理

2022-09-13

注意层是现代端到端自动语音识别系统不可或缺的一部分，例如作为变压器或构象体体系结构的一部分。注意通常是多头的，每个头部都有一组独立的学习参数，并在相同的输入特征序列上运行。多头注意的输出是单个头部输出的融合。我们经验分析了不同注意力头部产生的表示之间的多样性，并证明在训练过程中头部高度相关。我们研究了一些增加注意力头多样性的方法，包括为每个头部使用不同的注意力机制和辅助训练损失功能来促进头部多样性。我们表明，在训练过程中引入多样性辅助损失功能是一种更有效的方法，并且在Librispeech语料库上获得了多达6％的相对相对的改善。最后，我们在注意力头的多样性与头部参数梯度的相似性之间建立了联系。

translated by 谷歌翻译

Multi-modal Contrastive Representation Learning for Entity Alignment

Zhenxi Lin , Ziheng Zhang , Meng Wang , Yinghui Shi , Xian Wu , Yefeng Zheng

分类：自然语言处理 | 人工智能 | 机器学习

2022-09-02

多模式实体对齐旨在确定两个不同的多模式知识图之间的等效实体，这些实体由与实体相关的结构三元组和图像组成。大多数先前的作品都集中在如何利用和编码不同模式中的信息，而由于模态异质性，因此在实体对齐中利用多模式知识并不是微不足道的。在本文中，我们提出了基于多模式对比度学习的实体比对模型McLea，以获得多模式实体对准的有效联合表示。与以前的工作不同，麦克莱尔（McLea）考虑了面向任务的模式，并为每个实体表示形式建模模式间关系。特别是，麦克莱（McLea）首先从多种模式中学习多个单独的表示，然后进行对比学习以共同对模式内和模式间相互作用进行建模。广泛的实验结果表明，在受监督和无监督的设置下，MCLEA在公共数据集上优于公共数据集的最先进的基线。

translated by 谷歌翻译

HTML版本

Class-Aware Visual Prompt Tuning for Vision-Language Pre-Trained Model

Yinghui Xing , Qirui Wu , De Cheng , Shizhou Zhang , Guoqiang Liang , Yanning Zhang

分类：计算机视觉

2022-08-17

随着大型预训练的Vison语言模型（如剪辑）的出现，可以通过及时调整来调整可转让表示形式。及时调整试图从存储在预训练的视觉模型的图像和文本编码器中的常识中探索有益信息，以探索下游任务。最近提出的名为“上下文优化”（COP）的方法将一组可学习的向量从语言侧引入文本提示符，而单独调整文本提示符则不会影响图像编码器的计算视觉特征，从而导致了次级优势。在本文中，我们通过学习文本提示并同时为文本和图像编码器提供双重模式提示调整范式。此外，为了使视觉提示更多地集中在目标视觉概念上，我们提出了类感知的视觉及时调整（CAVPT），该调整是通过在模板提示和视觉类别令牌嵌入的语言描述之间进行交叉注意来动态生成的。我们的方法提供了一种新的范式来调整大型预训练的视觉模型，并在8个数据集上进行了广泛的实验结果，证明了该方法的有效性。我们的代码在补充材料中可用。

translated by 谷歌翻译